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摘 要 音乐 和 语言 是 人 类 最 重要 的 两 种 交流 系统 。 与 语言 一 样 ， 音 符 的 排列 和 组 织 也 是 建立 在 一 定 的 句法 
规则 之 上 。 尽 管 现 有 研究 发 现 听众 具有 感知 音乐 句法 的 能 力 ， 音乐 句法 加 工 的 认 知 机 制 以 及 影响 因素 仍 不 清 
楚 . 基 于 此 ， 拟 深入 探究 预期 和 整合 在 音乐 音 高 句法 加 工 中 的 作用 ,以 及 音乐 层级 结构 和 时 间 结 构 对 音 高 句法 


加 工 的 影响 。 
供 实证 依据 。 
关键 词 
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音乐 和 语言 是 人 类 最 重要 的 两 种 交流 方式 。 
和 语言 一 样 ， 音 符 之 间 的 排列 并 不 是 随意 组 织 ， 
而 是 遵循 一 定 的 句法 规则 (Lerdahl & Jackendoff, 
1983; 叶 铮 , 周 晓 林 ，2006; Flint, FEE, 杨 
玉 芳 ,2012)。 建 立 在 调 性 音乐 基础 之 上 的 音 高 组 
织 规则 是 一 种 突出 的 句法 现象 ， 既 约束 着 和 弦 的 
构成 与 连接 , 也 体现 在 旋律 音 高 的 进行 之 中 ， 从 
而 构筑 起 整个 乐曲 的 进行 和 发 展 (Patel，2010; 马 
W, BEJI, KEH, 2016; 张 晶 唱 ， 杨 玉 芳 ， 
2017). 

音乐 句法 在 音乐 感知 中 起 着 重要 作用 ,制约 
着 听众 对 音乐 事件 的 期 待 ， 并 在 此 基础 上 促成 音 
乐 情 感 和 美学 体验 的 产生 (Koelsch, 2014)。 现 有 音 
乐句 法 研究 主要 集中 于 考察 人 们 是 否 具 有 音乐 句 
法 的 内 隐 知 识 。 实 验 结 果 发 现 , 由 于 长 期 暴露 在 
调 性 音乐 环境 中 ,听众 普遍 具有 感知 音乐 句法 的 
能 力 (Koelsch, Vuust, & Friston, 2019)。 进 一 步 的 
科学 问题 是 ， 音 乐句 法 加 工 的 认 知 机 制 是 什么 ? 
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以 期 进一步 揭示 音乐 名 法 加 工 的 本 质 ， 为 音乐 和 语言 的 比较 以 及 探索 人 类 更 一 般 的 交流 机 制 提 
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音乐 句法 加 工 如 何 受到 音乐 结构 的 调节 ? 
1 国内 外 研究 现状 


1.1 音乐 句法 加 工 的 认 知 机 制 

已 有 研究 主要 采用 行为 和 认 知 神经 科学 的 方 
法 考察 人 们 能 否 加 工 音乐 句法 。 实 验 中 ,研究 者 
通常 给 被 试 呈现 一 组 较 短 的 和 弦 序 列 ， 通过 操纵 
终止 和 弦 ( 目 标 和 弦 ) 或 者 先前 的 背景 和 弦 ， 构 建 
句法 合理 和 句法 不 合理 的 和 弦 序 列 ， 从 而 考察 人 
们 的 音乐 句法 加 工 能 力 。 行 为 研究 发 现 ， 当 和 蓄 
序列 句法 不 合理 时 ， 相 对 句法 合理 :听众 对 目标 
和 弱 的 加 工 速度 更 慢 (Bharucha & Stoeckig, 1987; 
Tillmann, Bigand, & Pineau, 1998)， 且 句法 违反 程 
度 非 常 微 弱 时 ， 这 种 差异 仍然 存在 (Bigand & 
Pineau, 1997; Bigand, Tillmann, Poulin, D'Adamo, 
& Madurell, 2001). ERP 结果 显示 ， 句 法 不 合理 的 
目标 和 弦 在 100~350 ms 处 诱发 右前 负 波 (early right 
anterior negativity, ERAN) (Jentschke, Friederici, & 
Koelsch, 2014; Koelsch, Gunter, Friederici, & 
Schréger, 2000; Koelsch, Jentschke, Sammler, & 
Mietchen，2007)， 且 在 晚期 阶段 诱发 N5 (Koelsch 
et al., 2000; Poulin-Charronnat, Bigand, & Koelsch, 
2006) 或 者 LPC (Lagrois, Peretz, & Zendel, 2018; 
Patel, Gibson, Ratner, Besson, & Holcomb, 1998), 
ERAN 反映 早期 对 句法 违反 的 探测 ，N5 或 者 LPC 
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反映 了 随后 句法 整合 过 程 和 对 音乐 结构 的 再 分 析 
(Koelsch et al., 2000; Patel et al., 1998), MEG 
(Maess, Koelsch, Gunter, & Friederici, 2001) 和 
fMRI (Tillmann, Janata, & Bharucha, 2003) 研 究 进 
一 步 定 位 了 音乐 句法 加 工 脑 区 ,发 现 音乐 句法 违 
反 相 比 句 法 合理 , 在 布 洛 卡 区 以 及 右 侧 镜像 区 域 
出 现 了 更 强 的 激活 。 

上 述 一 系列 研究 表明 ,听众 能 够 感知 音乐 句 
法 , 音乐 和 声 背 景 提 供 的 信息 即时 影响 了 新 出 现 
和 弦 的 加 工 。 那么 , 潜在 的 重要 问题 是 ， 音乐 句法 
的 加 工 是 怎样 进行 的 ? 我 们 认为 存在 两 种 可 能 的 
认 知 机 制 。 第 一 种 是 基于 预期 的 观点 : 随 着 音乐 
的 展开 ， 听众 根据 句法 知识 对 接 下 来 将 要 出 现 的 
和 弦 建 立 了 预期 ， 当 目标 和 弦 与 预期 不 一 致 时 ， 
听众 感到 诺 异 ， 导 致 对 目标 和 弦 加 工 更 困难 。 第 
二 种 是 基于 整合 的 观点 : 当 目 标 和 弦 与 音乐 背景 
句法 不 合理 时 , 在 目标 和 弦 出 现 之 后 ， 听众 需要 
花费 更 多 的 认 知 资源 , 将 目标 和 弦 整 合 到 音乐 背 
景 的 表征 之 中 。 

在 语言 加 工 领域 , 对 于 整合 和 预期 也 曾 有 过 
长 久 的 争论 (Kuperberg & Jaeger, 2016; van Petten 
& Luka, 2012)。 在 早期 阶段 ， 预 期 被 严重 忽视 ， 整 
合 观 点 占据 主导 地 位 。20 世纪 80 ER, 研究 者 们 
认为 句子 理解 是 缓慢 进行 的 ， 只 有 当 新 词语 呈现 
结束 并 且 完 成 词汇 理解 之 后 ,新 词语 与 句子 背景 
的 整合 才 开 始 进 行 (Kintsch, 1988)。 到 20 世纪 90 年 
RRK, 研究 者 们 虽然 发 现 整 合 不 是 延迟 而 是 即时 
发 生 的 , 但 是 也 只 有 当 新 词语 出 现 后 句子 背景 才 
会 对 其 加 工 产 生 影响 (Tanenhaus，Spivey-Knowlton， 
Eberhard, & Sedivy, 1995)。 近 些 年 ， 随 着 实验 范式 
和 实验 技术 的 进步 ， 预 期 在 语言 加 工 中 的 作用 开 
始 凸 显 出 来 (e.g. Chen et al., 2016; DeLong, Urbach, 
& Kutas, 2005; Ito, Corley, Pickering, Martin, & 
Nieuwland, 2016; Ito, Pickering, & Corley, 2018; Li, 
Zhang, Xia, & Swaab, 2017; Maess, Mamashli, 
Obleser, Helle, & Friederici, 2016)。 一 系列 研究 支 
持 了 句法 预期 在 语言 加 工 中 的 作用 ， 例 如 ，Lau， 
Stroud, Plesch 和 Phillips (2006) 给 被 试 呈现 两 类 句 
子 ， 比 如 句 (1) 和 人 句 (2)， 这 两 个 句子 的 结构 相似 ， 
且 在 关键 词 of 上 都 出 现 句 法 违反 : 

句 (1): Although Erica kissed Mary’s mother, 
she did not kiss Dana’s of the bride. 

名 (2): Although the bridesmaid kissed Mary, 


she did not kiss Dana’s of the bride. 

在 句 (1) 中 ，Dana’s 后 面 既 可 以 直接 结束 也 可 
以 出 现 名 词 , 为 弱 句 法 预期 条 件 , 与 之 不 同 ,在 句 
(2) 中 ,Dana’s 后 面 必须 出 现 名 词 才 符合 句法 规则 ， 
因此 是 强 句法 预期 条 件 。 结 果 发 现 ,在 关键 词 of 
E, 强 预期 条 件 相 比 弱 预期 条 件 诱发 了 波幅 更 大 
的 ELAN, 说 明 语 言 理 解 过 程 受 到 了 句法 预期 的 
影响 。 男 外 一 些 研究 者 考察 了 关键 词 之 前 的 加 工 
阶段 ， 发现 此 时 人 们 已 经 能 够 预先 激活 句法 结构 
(Arai & Keller, 2013; Kamide, 2012; Kuperberg & 
Jaeger, 2016)， 比 如 在 阅读 和 口语 加 工 中 都 能 够 预 
先 激活 句法 性 别 信 息 (Otten,，Nieuwland, & van 
Berkum, 2007; Otten & van Berkum, 2008; van 
Berkum, Brown, Zwitserlood, Kooijman, & Hagoort, 
2005)， 从 而 更 加 明确 地 证 实 了 句法 预期 的 存在 。 
12 ”音乐 结构 对 句法 加 工 的 影响 

音乐 句法 加 工 总 是 发 生 在 一 定 的 音乐 结构 之 
中 , 那么 句法 加 工 如 何 受 到 音乐 结构 的 调节 ? 少 
量 研究 对 这 个 问题 进行 过 初步 探讨 , 但 是 结论 并 
不 一 致 。 
1.2.1 不 同 层级 结构 水 平 上 的 音乐 名 法 加 工 

音乐 在 呈现 过 程 中 并 不 是 永 不 停 欣 地 进行 ， 
而 是 通过 不 同 的 句 读 标志 划分 出 不 同 级 别 的 句法 
结构 单位 。 这 些 结构 单位 大 致 包括 动机 、 乐 节 、 
乐句 、 乐 段 及 其 与 它们 同 级 的 一 些 结构 形式 。 根 
据 句 法 规则 ,小 的 结构 相互 结合 形成 时 间 尺 度 更 
大 的 结构 ， 大 结构 再 结合 起 来 ,最终 形成 音乐 层 
级 结构 (Lerdahl & Jackendoff, 1983; Zhang, Jiang, 
Zhou, & Yang, 2016). 音乐 作品 借助 音乐 层级 结构 
的 排列 组 合 构 成 一 个 完整 的 结构 系统 ， 陈 述 音 乐 
内 容 ， 表达 音乐 形象 。 
如 1.1 所 述 , 现 有 音乐 句法 研究 的 实验 材料 
通常 包含 少数 几 个 和 弱 或 音符 ， 因 此 主要 考察 】 
较 低 层级 的 句法 加 工 过 程 ， 对 应 于 乐句 或 者 乐句 
以 下 的 结构 。 除 了 低层 级 的 句法 加 工 ， 听 众 是 否 
能 够 将 新 出 现 的 音符 或 和 弦 整 合 到 更 高 层级 的 音 
乐 结构 之 中 ? 早期 行为 研究 得 到 了 否定 的 结果 。 
例如 ,实验 中 将 音乐 片段 按照 小 节 、 乐 节 和 乐句 
截 开 再 随机 排列 ， 考察 这 种 强烈 的 违反 是 否 会 干 
扰 听 众 对 于 音乐 的 加 工 。 结 果 发 现 ， 只 有 在 低层 
级 结构 水 平 上 (小 节 和 乐 节 ) 随 机 排列 ， 被 试 对 目 
标 刺激 的 探测 才 会 受到 影响 (Tillmann & Bigand, 
1998)。 同 样 ， 只 有 在 局 部 结构 上 随机 排列 ， 人 们 
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才能 敏感 地 觉察 出 违反 ， 从 而 影响 他 们 对 于 音乐 
审美 和 连贯 性 的 判断 (Eitan & Granot, 2008; Granot 
& Jacoby, 2011)。 

难道 高 层级 的 音乐 结构 只 存在 于 音乐 理论 之 
中 ,并 不 具有 知觉 现实 性 ?最近 几 项 研究 采用 认 
知 神经 科学 的 方法 ,考察 了 更 高 层级 的 句法 加 工 
过 程 (Koelsch, Rohrmeier, Torrecuso, & Jentschke, 
2013; Ma, Ding, Tao, & Yang, 2018a, 2018b)。 在 这 
些 研究 中 ,实验 材料 由 两 个 乐句 组 成 ， 这 两 个 乐 
句 构 成 一 个 乐 段 。 因 此 ,最 后 的 目标 和 蓄 与 第 一 
个 乐句 之 间 的 句法 依存 关系 发 生 在 更 高 层级 的 乐 
段 层 面 。 对 第 一 个 乐句 进行 操纵 , 使 得 目标 和 六 
与 第 一 个 乐句 之 间 的 句法 依存 关系 合理 或 者 不 合 
理 。 结 果 发 现 ,与 低层 级 句法 违反 一 样 ， 乐 段 结 构 
中 的 句法 违反 同样 诱发 了 早期 的 ERAN 成 分 和 晚 
期 的 NS 成 分 ,表明 更 高 层级 的 音乐 结构 也 会 影 
向 当前 信息 的 加 工 。 不 同 的 是 , Koelsch 等 人 (2013) 
的 实验 中 , 无 论 音乐 家 还 是 非 音乐 家 都 能 进行 高 
层级 的 音乐 句法 加 工 , 但 是 在 Ma 等 人 (2018a， 
2018b) 的 研究 中 ， 高 层级 的 句法 加 工 却 依赖 于 专 
业 的 音乐 训练 。 实 验 结 果 的 差异 ,可 能 是 因为 实 
丛 中 选用 的 音乐 材料 都 是 西方 音乐 ， 前 一 个 研究 
是 西方 被 试 加 工 西 方 音 乐 ， 而 后 面 的 研究 是 中 国 
被 试 加 工 西 方 音乐 ， 此 时 类 似 于 二 语 加 工 ， 因 而 
难度 更 大 。 

如 果 在 音乐 加 工 中 听众 不 仅 能 够 进行 低层 级 
句法 加 工 , 也 能 进行 更 高 层级 的 句法 加 工 ， 那么 
不 同 层级 结构 中 的 句法 加 工 是 如 何 共同 发 生 的 ? 
一 项 脑 成 像 研 究 分 别 将 音乐 片段 按照 小 节 、 乐 句 、 
乐 段 截 开 再 随机 排列 ， 结 果 发 现 , 听众 能 够 进行 
不 同 层级 的 句法 加 工 ， 层 级 越 高 , 加工 脑 区 从 初 
级 感觉 皮层 向 更 高 级 的 脑 区 移动 , 在 脑 区 上 也 表 
现 出 层级 分 布 Earbood，Heeger，Marcus，Hasson， 
& Lerner, 2015)。 除 了 加 工 脑 区 , 不 同 层 级 的 句法 


能 发 生 ， 并 且 低 层级 句法 加 工 可 能 存在 优先 性 。 
这 项 研究 比较 了 不 同 距 离 的 句法 加 工 过 程 , 但 是 
由 于 两 个 乐句 之 间 不 构成 层级 关系 ,因此 并 没有 
涉及 不 同 层级 结构 中 的 句法 整合 过 程 。 最 新 一 项 
研究 对 这 个 问题 进行 了 初次 探讨 , 研究 者 同时 比 
较 了 听众 对 近 距 离 句 法 依存 和 长 距离 句法 依存 的 
加 工 , 这 两 种 句法 加 工 过 程 分 别 发 生 在 乐句 和 乐 
股 结构 之 中 (Zhou, Liu, Jiang, Jiang, & Jiang, 2019). 
结果 发 现 ， 对 于 控制 组 被 试 而 言 ， 乐 句 内 的 句法 
违反 诱发 了 ERAN、N5 F LPC 成 分 乐 段 层 面 的 
句法 违反 诱发 了 类 ERAN 成 分 和 N5 成 分 。 相 关 
分 析 发 现 ERAN 和 类 ERAN 之 间 并 不 存在 相关 
可 能 表明 高 层级 句法 违反 的 探测 需要 额外 的 加 工 
过 程 。 对 于 先天 性 失 歌 症 被 试 而 言 ， 两 种 层级 的 
句法 整合 过 程 均 难以 进行 。 
12.2 ”音乐 时 间 结 构 对 音 高 句法 加 工 的 影响 

音乐 中 的 句法 规则 包括 音 高 和 时 间 两 个 层面 
(Fitch, 2013; Sun, Liu, Zhou, & Jiang, 2018)， 本 项 
目 中 的 音乐 句法 指 的 是 建立 在 音 高 结构 上 的 组 织 
规则 。 除 了 音 高 结构 ， 构 成 音乐 的 另 一 个 重要 的 
结构 是 时 间 结 构 ( 张 晶 晶 , 杨 玉 芳 , 2017)。 音 乐 的 
时 间 结 构 主 要 包括 时 长 (duration) 、 节 奏 (rhythm) 
和 节拍 (meter)。 时 长 是 每 个 声音 或 者 休止 持续 的 
时 间 ， 而 节奏 是 指 这 些 声音 或 休止 在 时 间 上 如 何 
组 织 ， 节拍 则 是 拍子 按照 特定 的 强 弱 规律 循环 往 
复 ( 江 俊 , EIS, HI, HEE ME, 2014). 我 们 听 音 
乐 时 ， 只 有 将 音 高 结构 和 时 间 结 构 结合 起 来 , 才 
能 形成 连贯 的 音乐 表征 (Lerdahl & Jackendoff, 
1983)。 那 么 , 音乐 音 高 句法 加 工 是 否 会 受到 时 间 
结构 的 影响 ? 关于 这 个 问题 存在 两 种 理论 模型 
分 别 是 单一 成 分 模型 (Jones & Boltz, 1989) 和 双 成 
分 模型 (Peretz & Coltheart, 2003; Peretz & 
Kolinsky, 1993). 

单一 成 分 模型 (single-component model) fit i 


=a 


加 工 在 加 工 进程 和 加 工 难 度 等 方面 是 否 有 差异 ? 
Zhang, Zhou, Chang 和 Yang (2018) 使 用 两 个 乐句 
长 度 的 音乐 材料 采用 EEG 技术 ， 同 时 考察 了 目 
标 和 疏 与 第 一 个 乐句 ( 远 距离 ) 和 第 二 个 乐句 ( 近 距 
离 ) 的 整合 。 结 果 发 现 ， 在 早期 阶段 ,只 有 近 距 离 
句法 违反 诱发 ERAN 效应 , 表明 近 距 离 的 句法 加 
工 更 早 发 生 ; 在 晚期 阶段 ， 近 距离 . 远 距离 句法 违 
反 均 诱发 N5 效应 , 并 且 不 同 距离 的 句法 加 工 在 
NS 上 存在 交互 作用 ,表明 不 同 距 离 的 句法 加 工 均 


音乐 句法 结构 和 时 间 结 构 之 间 存 在 交互 作用 
(Jones & Boltz, 1989)。 该 模型 认为 , 我 们 大 脑 中 的 
神经 元 会 同时 追踪 音 高 和 时 间 维 度 (pitch-time 
entrainment)， 形 成 联合 预期 ， 共 同 指导 听众 注意 
资源 的 分 配 。 当 音 高 事件 出 现在 预期 时 间 点 ， 此 
时 注意 处 于 峰值 ， 音 高 事件 能 够 得 到 更 好 的 加 
工 。 单 一 成 分 模型 得 到 了 一 些 实验 研究 的 支持 。 
例如 一 项 行为 研究 发 现 ， 当 音符 出 现 的 时 间 符 合 
规则 时 ， 相 比 提前 或 者 延迟 出 现 ， 被 试 对 音符 音 
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高 的 判断 更 加 准确 (Jones，Moynihan，MacKenzie， 
& Puente, 2002)。 男 外 一 些 研究 给 被 试 呈现 一 段 旋 
律 或 者 和 弦 序 列 ， 分 别 操纵 音乐 序列 的 句法 合理 
性 和 时 间 合 理性 ， 要 求 被 试 对 这 段 音乐 序列 的 句 
法 合理 性 进行 判断 。 结 果 发 现 , 被 试 对 句法 合理 
性 的 判断 受到 音乐 时 间 结 构 的 影响 ， 当 旋律 或 者 
和 弱 序 列 的 时 间 结 构 违 反 时 ， 句 法 合理 性 的 评分 
显著 更 低 (Schmuckler & Boltz, 1994; Tillmann & 
Lebrun-Guillaud, 2006)。 除 此 之 外 , 一 项 fMRI 实 
验 也 显示 ， 当 被 试 演奏 音乐 序列 时 ， 音 高 维度 和 
时 间 维 度 都 会 激活 感觉 运动 脑 区 ， 表 明 两 者 在 加 
TKX EFEEA(Brown et al., 2013)。 

双 成 分 模型 (two-component mode) U N È 
维度 和 时 间 维 度 是 组 成 音乐 的 两 个 平行 、 独 立 的 
子 系统 ,因此 ， 音 高 句法 的 加 工 不 受 时 间 结 构 的 
影响 (Peretz & Coltheart, 2003; Peretz & Kolinsky, 
1993)。 这 个 模型 的 提出 首先 基于 神经 心理 学 的 证 
据 。 对 于 脑 损伤 患者 的 案例 研究 发 现 ， 一 些 患 者 
音 高 加 工 受 损 , 但 是 节奏 加 工 与 控制 组 相 比 不 存 
在 显著 差异 ; 另外 一 些 患 者 无 法 准确 地 感知 音乐 
节奏 , 但 是 音 高 知觉 正常 (Peretz, 1990, 1996)。 这 
种 临床 上 双 分 离 现象 提示 音 高 和 时 间 两 个 维度 是 
独立 加 工 的 。Lebrun-Guillaud，Tillmann 和 Justus 
(2008) 给 小 脑 损伤 患者 呈现 8 AGRE, HOP AG 
序列 终止 式 以 及 和 弦 序 列 的 时 间 结 构 进 行 操纵 ， 
构建 音 高 句法 合理 、 不 合理 以 及 时 间 结 构 合 理 、 
不 合理 的 和 弦 序 列 。 结 果 发 现 ， 小脑 损伤 只 对 音 
乐 时 间 结 构 的 判断 产生 影响 ， 影响 音乐 音 高 
名 法 的 加 工 。 除 了 神经 心理 学 的 证 据 , 来 自 正常 
被 试 的 研究 同样 给 双 成 分 模型 提供 了 实验 支持 。 
Palmer 和 Krumhansl (1987) 给 被 试 呈 现 不 同 版 本 
的 音乐 序列 : 第 一 种 是 原始 序列 , 音乐 旋律 中 包 
含 完整 的 时 间 结 构 和 音 高 结构 ; 对 这 个 序列 分 别 
进行 修改 ， 使 得 修改 版 本 中 只 保留 时 间 结 构 或 者 


2 问题 的 提出 


综 上 所 述 , 音乐 句法 研究 在 近 些 年 取得 了 较 
大 进展 ,研究 者 们 发 现 听 众 由 于 专业 的 音乐 训练 
或 者 长 期 的 内 隐 学 习 ， 具备 了 加 工 音 乐句 法 的 能 
J, 并 且 找 出 了 反映 音乐 句法 加 工 的 特定 ERP 成 
分 以 及 加 工 脑 区 。 在 此 基础 之 上 ， 仍 有 一 些 重要 
的 科学 问题 尚 待 考察 。 

第 一 ， 音 乐句 法 加 工 的 认 知 机 制 是 基于 整合 
还 是 预期 ? 已 有 大 量 研 究 发 现 ， 当 目标 刺激 与 音 
乐 背 景 之 间 句 法 不 合理 时 ， 相 比 于 句法 合理 ， 被 
试 对 于 目标 刺激 的 加 工 在 行为 和 认 知 神经 指标 中 
都 表现 出 更 大 的 困难 。 这 种 加 工 困难 存在 两 种 可 
能 的 认 知 机 制 。 第 一 种 是 整合 更 加 困难 ， 当 目标 
刺激 与 音乐 背景 句法 不 合理 时 , 在 目标 刺激 出 现 
之 后 ,听众 需要 花费 更 多 的 认 知 资源 ,将 目标 刺 
激 整 合 到 先前 音乐 背景 的 表征 之 中 。 第 二 种 是 预 
期 带 来 的 代价 ， 随 着 音乐 的 展开 ， 听 众 根据 句法 
知识 对 接 下 来 将 要 出 现 的 音乐 事件 建立 了 预期 
当 目标 刺激 与 预期 不 一 臻 时， 听众 感到 府 异 ， 导 
致 对 目标 刺激 加 工 更 困难 。 如 果 要 试图 分 离 这 两 
种 可 能 的 认 知 机 制 ， 研 究 者 需要 清楚 地 揭示 在 目 
标 刺 激 出 现 之 前 ,听众 是 否 已 经 根据 背景 信息 建 
立 预期 , 预先 激活 了 目标 刺激 。 如 果 存 在 预先 激 
活 ， 则 清晰 地 揭示 了 预期 在 句法 加 工 中 的 作用 ; 
如 果 不 存 在 , 那么 研究 证 据 则 更 加 支持 整合 观 
点 。 现 有 行为 研究 将 关注 点 放 在 目标 刺激 出 现 之 
后 ， 因 而 难以 对 这 两 种 机 制 进行 区 分 。 认 知 神经 
科学 的 研究 将 关注 点 放 在 目标 刺激 出 现 之 时 ， 例 
如 EEG 研究 中 ,句法 不 合理 的 目标 刺激 在 100~ 
350 ms 出 现 了 ERAN 成 分 ,尽管 这 种 早期 成 分 被 
认为 反映 自动 或 半自动 化 的 句法 违反 探测 过 程 ， 
但 是 仍然 难以 说 明 这 种 探测 过 程 主要 是 基于 何 种 
机 制 产生 的 。 本 项 目 拟 深 入 考察 目标 刺激 出 现 之 


a 


音 高 结构 。 被 试 的 任务 是 对 音乐 序列 的 完整 度 进 
行 评分 , 结果 发 现 原始 版 本 的 完整 度 评分 是 时 间 
版 本 和 音 高 版 本 完整 度 评分 的 线性 相 加 ,研究 者 
据 此 认为 音乐 时 间 结 构 和 音 高 句法 结构 是 独立 加 
工 的。 一 项 脑 成 像 研究 采用 类 似 的 实验 材料 ， 发 
现 被 试 在 演奏 这 些 不 同 版 本 的 音乐 序列 时 ,分 别 


前 的 预期 阶段 和 出 现 之 后 的 整合 阶段 ,揭示 预期 
和 整合 在 音乐 句法 加 工 中 的 作用 ,以 及 两 种 机 制 
之 间 可 能 存在 的 相互 影响 。 

第 二 , 音乐 句法 加 工 如 何 受 到 音乐 结构 的 调 
节 ? 音乐 句法 加 工 总 是 发 生 在 一 定 的 音乐 结构 之 
中 , 但 是 音乐 句法 加 工 如 何 受到 音乐 结构 的 调节 


激活 了 不 同 的 脑 区 ， 时间 结构 激活 了 腹 侧 视觉 通 
路 ,而 句法 结构 激活 了 背 侧 视觉 通路 (Bengtsson 
& Ullén, 2006)。 


目前 并 不 清楚 。 具 体 而 言 , 音乐 层级 结构 在 音乐 
理论 中 占据 了 重要 的 地 位 (Lerdahl & Jackendoff, 
1983; Meyer, 2008)， 也 是 作曲 家 组 织 作品 、 表 演 
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家 演绎 作品 的 重要 手段 。 但 是 ， 是 否 存在 高 层级 
句法 加 工 过 程 仍然 有 待 更 多 实验 证 据 的 支持 。 更 
重要 的 问题 是 , 不 同 层级 的 句法 加 工 过 程 如 何 共 


设计 3 个 系列 研究 考察 上 述 两 个 关键 问题 。 研 究 
一 考察 预期 和 整合 在 音乐 句法 加 工 中 的 作用 , W 
究 二 考察 不 同音 乐 层 级 结构 中 句法 的 加 工 ， 研 究 


同 发 生 几 乎 无 人 涉及 ,， 蝇 需 对 此 展开 深入 人 研究。 
对 于 音乐 时 间 结 构 ， 目 前 有 少量 研究 考察 了 时 间 
维度 对 音 高 句法 加 工 的 影响 ,但 是 结论 
致 。 一 部 分 研究 支持 独立 加 工 的 双 成 分 模型 ， 
一 部 分 研究 支持 反映 相互 影响 的 单一 
基于 此 ,Peretz 等 提出 多 重 加 工 阶段 理论 (multiple 
stage processing model), 认为 音 高 维度 和 时 间 维 
度 在 早期 独立 加 工 , 在 晚期 阶段 两 者 存在 交互 作 
用 (Peretz & Coltheart, 2003)。 那么 ,两 个 维度 何 时 
独立 加 工 ， 何 时 会 发 生 交互 作用 ?” 对 于 上 述 两 个 
关键 问题 ， 多重 加 工 阶 段 理论 仍然 局 限 在 概念 框 
架 模 型 对 认 知 机 制 的 描述 阶段 , 需要 实验 证 据 的 
支持 。 采 用 具有 高 时 间 分 辨 率 的 EEG, 将 有 助 于 
对 这 个 问题 进行 解析 。 综 上 ， 本 项 目 拟 采用 EEG 
技术 ,考察 不 同音 乐 层级 结构 和 时 间 结 构 中 音 高 
句法 的 加 工 。 


3 研究 构想 


3.1 ”研究 问题 和 方法 

本 项 目 拟 深 入 研究 音乐 句法 的 加 工 , 重点 解 
决 两 个 问题 : 音乐 句法 加 工 的 认 知 机 制 ; 音乐 句 
法 加 工 如何 受 到 音乐 结构 的 调节 (图 1)。 研究 者 拟 


音乐 句法 加 工 的 认 知 机 制 与 音乐 结构 的 影响 模式 


考察 音乐 时 间 结 构 对 音乐 音 高 句法 加 工 的 影 
响 。 此 外 ,音乐 训练 是 音乐 认 知 研究 中 的 重要 变量 
(Carey et al., 2015; Du & Zatorre, 2017; Nan et al., 
2018; Sun et al., 2018)。 在 音乐 句法 加 工 中 ,音乐 
家 相 比 非 音乐 家 对 句法 违反 的 探测 更 加 敏感 
(Koelsch, Schmidt, & Kansok, 2002; Müller, Héfel, 
Brattico, & Jacobsen, 2010)， 表 现在 诱发 出 波幅 更 
大 的 早期 右前 负 波 ERAN。 其 中 的 原因 ， 可 能 是 
由 于 在 音乐 呈现 过 程 中 ， 音 乐 家 根据 已 有 知识 对 
即将 出 现 的 音乐 事件 建立 了 更 强 的 期 待 (Koelsch 
et al., 2007)。 鉴 于 此 , 本 项 目 中 3 个 研究 都 将 考察 
音乐 训练 对 实验 效应 的 调节 作用 ， 以 期 更 加 系统 
深入 地 探讨 音乐 句法 的 加 工 过 程 。 

研究 工具 方面 ,由 于 本 项 目的 几 个 研究 都 需 
要 精确 考察 在 线 加 工 的 时 间 进 程 ， 因 此 采用 具有 
高 时 间 分 辩 率 的 EEG 技术 作为 研究 工具 。 对 采集 
到 的 EEG 数据 分 别 进 行 ERP 分 析 和 时 频 分 析 。 
ERP 分 析 对 EEG 信号 在 时 域 上 进行 至 加 平均 ,能 
够 有 效 考察 与 事件 锁 时 锁 相 的 脑 电位 变 | 频 
分 析 是 从 时 域 和 频 域 角度 分 析 EEG 信号， 考察 单 
个 电极 点 上 各 频段 的 能 量变 化 ,能 够 观察 ue 
具有 锁 时 关系 的 频 域 特征 。 通 过 Pe 以 其 


预期 ， 目 标 刺 激 出 现 
= 之 前 预先 激活 

整合 : 目标 可 出现 之 后 
= 再 整合 到 背景 


模块 一 : 音乐 句法 加 工 的 认 知 机 制 
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得 到 汇聚 性 结果 , 增加 实验 结论 的 可 靠 性 。 

实验 被 试 方面 , 为 了 考察 音乐 训练 的 调节 作 
用 ,所 有 实验 均 采 用 两 组 被 试 , 分 别 是 受过 10 年 
以 上 专业 音乐 训练 的 音乐 家 ,以 及 未 接受 过 专业 
音乐 训练 的 非 音 乐 家 。 同 时 ， 对 于 两 组 被 试 的 年 
龄 、 性 别 、 利 手 、 智 力 水 平 以 及 受 教育 年 限 等 因 
素 进 行 匹配 。 

实验 材料 方面 ,为 了 排除 音乐 熟悉 性 对 被 试 
加 工 过 程 的 影响 , 所 有 实验 均 采 用 不 熟悉 的 音乐 
作为 实验 材料 。 为 了 保证 音乐 材料 符合 实验 设计 的 
BER, 在 正式 实验 之 前 将 对 实验 材料 进行 测评 。 
3.2 ”实验 设计 与 预期 结果 

研究 1: 音乐 句法 加 工 的 认 知 机 制 : 基于 整 
合 还 是 预期 

现 有 研究 发 现 听众 普遍 具有 感知 音乐 句法 的 
能 力 , 但 是 其 中 的 加 工 机 制 主要 是 基于 整合 还 是 
预期 却 并 不 清楚 。 研 究 者 们 都 将 关注 点 放 在 新 信 
息 出 现 之 时 或 者 之 后 ， 因 而 难以 对 这 两 种 机 制 进 
行 分 离 。 研 究 1 拟 操纵 目标 刺激 在 音乐 序列 中 的 
句法 合理 性 ， 以 及 音乐 背景 的 预期 性 ， 同 时 考察 
目标 刺激 出 现 之 前 的 预期 阶段 和 出 现 之 后 的 整合 
阶段 ， 从 而 探究 预期 和 整合 在 音乐 句法 加 工 中 的 
作用 。 此 外 , 选取 音乐 家 和 非 音乐 家 两 组 被 试 ， 对 
比 他 们 在 实验 效应 上 的 差异 ， 考察 音 乐 训练 是 否 
影响 句法 加 工 机 制 。 

基于 音乐 句法 的 现 有 研究 (e.g., Koelsch et al., 
2000, 2007) 以 及 语言 加 工 中 的 预期 研究 (e.g,， 
DeLong et al., 2005)， 本 研究 主要 预期 包括 : (1) 如 
果 支 持 预期 机 制 ， 那 么 在 预期 阶段 ， 高 预期 条 件 
和 低 预期 条 件 在 ERP 波幅 和 时 频频 段 上 会 表现 出 
显著 差异 ; 反之 , 不 存在 任何 差异 ; (2) 在 整合 阶 
Br, 句法 不 合理 音符 相 比 句法 合理 音符 ,ERP 上 
诱发 波幅 更 大 的 ERAN 和 N5， 时 频 上 可 能 呈现 早 
期 alpha 频段 能 量 降低 ， 晚 期 gamma 能 量 降 低 
(Ruiz, Koelsch, & Bhattacharya, 2009); (3) 音 乐 训 
练 会 调节 句法 加 工 的 策略 或 者 敏感 程度 ,表现 为 
ERP 成 分 和 时 频频 段 上 质 的 差异 或 者 量 的 变化 。 

研究 2: 不 同 结构 层级 水 平 上 的 音乐 句法 加 工 

层级 加 工 记 忆 模 型 认为 ， 不 同时 间 尺 度 的 背 
景 信 息 会 持续 影响 当前 信息 的 加 工 (Hasson, Chen, 
& Honey, 2015)。 那 么 ,音乐 句法 加 工 如 何 受 到 不 
同 层 级 结构 中 背景 信息 的 影响 ” 现 有 研究 主要 集 
中 于 考察 低层 级 句法 加 工 过 程 ， 更 高 层级 结构 的 


作用 并 不 清楚 。 更 重要 的 是 , 不 同 层 级 的 句法 加 
工 过 程 如 何 共同 发 生 鲜 有 涉及 。 因 此 , 研究 2 拟 
选用 时 间 尺 度 较 长 的 音乐 材料 ,包含 两 个 不 同 层 
级 的 音乐 结构 ,分 别 操纵 目标 刺激 与 低层 级 、 高 
层级 音乐 背景 之 间 的 句法 依存 关系 ,形成 句法 合 
理 或 者 不 合理 的 音乐 序列 ， 并且 选取 音乐 家 和 非 
音乐 家 两 组 被 试 ， 从 而 考察 : (1) 是 否 存 在 高 层级 
句法 加 工 过 程 ; (2) 如 果 存 在 高 层级 句法 加 工 ， 那 
么 不 同 层级 的 句法 加 工 在 加 工 进程 、 加 工 难度 等 
方面 是 否 存 在 差异 ; (3) 对 比 音 乐 家 和 非 音 乐 家 两 
组 被 试 在 实验 效应 上 的 差异 ， 考 察 音 乐 层级 句法 
加 工 能 力 是 否 依 赖 于 音乐 训练 。 
基于 层级 加 工 记忆 模型 (Hasson et al., 2015) 
六 及 先前 的 实验 研究 (e.g.，Koelsch et al., 2013; 
Zhang et al., 2018), 研究 2 主要 包括 如 下 预期 : (1) 
氏 层 级 句法 不 合理 条 件 相 比 合理 条 件 , 在 ERP 上 
诱发 波幅 更 大 的 ERAN 和 N5， 时 频 上 早期 alpha 
频段 能 量 降低 ， 晚 期 gamma 能 量 降低 (Ruiz et al., 
2009); (2) 高 层级 句法 不 合理 会 诱发 与 低层 级 不 合 
理 类 似 的 脑 电 成 分 ; (3) 不 同 层级 的 句法 加 工 在 晚 
期 时 间 窗 口 存在 交互 作用 ; (4) 不 同音 乐 层级 结构 
中 的 句法 加 工 受到 音乐 训练 的 调节 ， 特 别 是 高 层 
级 句法 加 工 依赖 音乐 训练 。 

研究 3: 音乐 时 间 结 构 对 音乐 音 高 句法 加 工 
的 影响 

本 项 目 中 的 句法 加 工 是 基于 音乐 音 高 结构 的 
加 工 ， 除 了 音 高 结构 ， 音 乐 中 另外 一 个 重要 的 维 
度 是 时 间 结 构 。 只 有 将 两 个 维度 组 合 起 来 ， 才能 
对 音乐 事件 形成 连贯 的 表征 (Lerdahl & Jackendoff, 
1983)。 音乐 音 高 句法 加 工 是 否 受 到 音乐 时 间 结 构 
的 影响 ? 现 有 研究 对 于 这 个 问题 存在 很 大 忽视 ， 
仅 有 的 研究 也 得 到 了 冲突 的 结果 (Tillmann & 
Lebrun-Guillaud, 2006), WR 3 WM HFE J, 
A XT E PIA ER Er FG A AS oe PA HE TT BRA, 
形成 句法 合理 、 不 合理 以 及 时 间 结 构 合理 、 不 合 
理 的 和 弱 序 列 ， 此 外 选取 音乐 家 和 非 音乐 家 两 组 
被 试 ， 考察 音乐 音 高 句法 加 工 是 否 受到 音乐 时 间 
结构 的 影响 ;如果 时 间 结 构 影 响 音 高 句法 加 工 
这 种 影响 何 时 以 及 如 何 发 生 ; 对 比 两 组 音乐 经 验 
不 同 的 被 试 所 诱发 的 脑 电 效 应 ,考察 实验 效应 是 
否 受 到 音乐 训练 的 调节 。 

基于 多 重 加 工 阶段 理论 (Peretz & Coltheart, 
2003) 以 及 音乐 句法 、 时 间 结 构 的 现 有 研究 , 研究 
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3 主要 包括 如 下 预期 : (1) 存 在 句法 合理 性 和 时 间 
结构 合理 性 的 主 效应 。 句法 违反 将 在 ERP 上 诱发 
波幅 更 大 的 ERAN 和 N5， 时 频 上 早期 alpha 频段 
能 量 降 低 ， 晚 期 gamma 能 量 降低 (Ruiz et al., 
2009)。 时 间 结 构 违 反 ， 特 别 是 目标 和 弦 提前 出 现 
(Geiser, Ziegler, Jancke, & Meyer, 2009; Zhang, Che, 
& Yang，2019)， 会 诱发 波幅 更 大 的 N150 或 者 
MMN; (2) 音 高 句法 加 工 和 时 间 结 构 存 在 交互 作用 ， 
音乐 时 间 结 构 会 在 早期 阶段 或 者 晚期 阶段 影响 音 
高 句法 效应 ; (3) 时 间 结 构 对 音 高 句法 加 工 的 调节 ， 
在 音乐 家 被 试 中 更 加 明显 ， 表 现 为 交互 作用 的 时 
间 点 提前 , 或 者 实验 效应 更 加 显著 。 


4 理论 意义 


本 项 目 在 现 有 音乐 句法 研究 的 基础 之 上 ， 拟 
深入 考察 音乐 句法 加 工 的 认 知 机 制 与 音乐 结构 对 
句法 加 工 的 影响 模式 , 将 进一步 揭示 音乐 句法 加 
工 的 本 质 ， 对 音乐 理论 进行 检验 和 推进 。 此 外 ,， 研 
究 结果 与 语言 研究 相互 比较 ,将 进一步 推动 音乐 
和 语言 的 比较 研究 ， 对 相关 语言 理论 和 更 一 般 认 
知 模型 的 验证 与 拓展 起 到 积极 作用 。 

在 语言 加 工 领 域 ， 层 级 多 重 表 征 生 成 模型 


(hierarchical 


multi-representational 
framework, Kuperberg & Jaeger, 2016) 以 及 Chunk- 
and-Pass 模型 (Christiansen & Chater, 2016) 都 认为 
语言 理解 是 一 个 即时 的 迅速 的 过 程 ， 预 期 在 其 中 
扮演 了 关键 的 作用 。 在 音乐 加 工 中 ,一些 音 乐理 
论 例如 ITPRA 理论 (Huron, 2006) 和 旋律 预期 模型 


generative 


那么 音乐 层级 结构 是 否 具有 认 知 现实 性 ”此 外 ， 
近 些 年 研究 者 采用 fMRI 技术 , 分 别 考察 了 语言 


(Lerner, Honey, Silbert, & Hasson，2011) 和 音乐 
(Farbo od et al., 2015) 中 的 层级 加 工 过 程 ， 发 现 层 
级 越 高 , 加工 脑 区 从 感觉 皮层 向 高 级 皮层 移动 ， 
在 脑 区 上 也 表现 出 层级 分 布 。 在 这 一 系列 实验 基 
础 之 上 ，Hasson 等 人 (2015) 提 出 了 层级 加 工 记 忆 
模型 (hierarchical process memory model), 认为 不 
同 层级 的 背景 信息 会 持续 影响 当前 信息 的 加 工 。 
那么 不 同 层 级 结构 中 的 音乐 背景 是 否 会 影响 音乐 
句法 的 加 工 ?” 如 果 存 在 影响 ,那么 除了 加 工 脑 区 
之 外 , 不 同 层 级 的 句法 加 工 在 加 工 进程 和 加 工 难 
度 上 又 存在 何 种 差异 ? 研究 二 考察 不 同 结构 层级 
水 平 上 的 音乐 句法 加 工 , 将 对 GTTM 模型 展开 检 
验 , 并 且 从 不 同 层面 对 层级 加 工 记忆 模型 进行 丰 
富 和 拓展 。 

本 项 目 中 的 音乐 句法 是 建立 在 音 高 维度 上 的 
一 组 规则 ， 除 了 音 高 之 外 ， 时 间 是 音乐 中 另外 一 
个 重要 维度 ， 听 者 需要 将 两 者 整合 起 来 ， 才 能 形 
成 连贯 的 音乐 表征 。 特 征 整合 是 认 知 心理 学 中 的 
一 个 基本 问题 (Treisman & Gelade, 1980)。 在 音乐 
领域 , Peretz 和 Coltheart (2003) 提 出 多 重 加 工 阶段 
理论 (multiple stage processing model), 认为 音 高 
维度 和 时 间 维 度 在 早期 独立 加 工 ,， 在 晚期 阶段 存 
在 交互 作用 。 在 认 知 神经 层面 , Friston 和 Buzsaki 
(2016) 基 于 语言 等 领域 的 研究 ， 提 出 了 双 通 路 模 
型 ， 认 为 类 似 于 what 和 where 通路 , 在 大 脑 中 同样 
存在 两 条 不 同 的 通路 , 来 分 别 加 工 what 和 when 


(Margulis, 2005) 同 样 强调 了 预期 的 作用 。 那 么 ， 音 


信息 。 研 究 三 采用 EEG 考察 音乐 时 间 结 构 对 音 高 


乐句 法 的 加 工 是 否 也 是 一 个 即时 迅速 的 过 程 ， 甚 
至 存在 预先 激活 的 预期 过 程 ? 现 有 音乐 句法 的 研 
究 都 将 关注 点 放 在 新 信息 出 现 之 时 或 者 之 后 ， 因 
而 难以 对 整合 和 预期 机 制 进行 区 分 。 研 究 一 拟 深 
人 考察 目标 刺激 出 现 之 前 的 预期 阶段 和 出 现 之 后 
的 整合 阶段 ， 进 一 步 揭示 音乐 句法 加 工 的 认 知 机 
制 ， 为 音乐 认 知 模型 的 构建 提供 实证 依据 。 同 时 
为 音乐 和 语言 的 比较 研究 提供 新 的 角度 ,推进 人 
类 更 一 般 交 流 机 制 模型 的 生成 。 

音乐 层级 结构 在 音乐 理论 中 占据 了 重要 的 地 
位 。 例 如 在 Lerdah 和 Jackendoff (1983) 提 出 的 著 
名 的 调 性 生成 理论 (a generative theory of tonal 
music，GTTM) 中 ， 其 核心 观点 就 是 认为 音乐 的 句 
法 结构 、 韵 律 结构 等 都 是 按照 层级 关系 组 织 的 。 


句法 加 工 的 影响 , 可 以 有 效 检验 多 重 加 工 阶段 理 
论 的 心理 现实 性 ,并 且 明 确 各 加 工 阶 段 的 时 间 进 
程 信息 。 同 时 以 音乐 材料 为 载体 ， 从 电 生 理 的 角 
度 进一步 考察 what ( 音 高 ) 和 when (时 间 ) 加 工 的 
认 知 神经 机 制 ,推动 一 般 认 知 模型 的 构建 。 
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Abstract: Music and language are the two most important sign systems for human beings. Similar to 
language, music is also constructed on certain syntactic rules. Although evidence has shown that listeners 
are sensitive to musical syntax, the underlying cognitive mechanism and its influencing factors are still 
unknown. Therefore, we intend to further explore the role of prediction and integration in musical syntactic 
processing, as well as the impact of musical hierarchical and temporal structures on musical syntactic 
processing. We expect the proposed studies to further reveal the nature of musical syntactic processing, and 
to provide empirical evidence for the comparison between music and language and the exploration of human 
general communication mechanism. 

Key words: musical syntax; hierarchical structures; temporal structures; cognitive mechanism; neural 


mechanisms 


